50 岁的 C 语言,掌控 Windows、Linux、macOS 等操作系统半边天!
【CSDN 编者按】诞生于1972年的C语言已经50岁了,目前来看,它还像20岁的小伙一样活力四射,似乎永不会退休,并且正在赋能全世界重量级应用系统的运行。
不久之前,CSDN发布了一篇《C不再是一门编程语言》的观点性文章。作者认为,C已经被提升到一个具有威望和权力的角色,它的统治是绝对和永恒的,以至于它扭曲了开发者与该语言之间的对话方式。当下,C是编程的通用语言,大家都必须学C,这也导致C不再只是一种编程语言,它成了每一种通用编程语言都需要遵守的协议。
可以看出,在编程语言众多的今天,C语言依然代表着权威。近日,Meta高性能C++数据仓库工程师Daniel发文表示,尽管C语言面世多年,甚至不少人用暮年来形容它,但它依然在为世界编程赋能,并且还将活跃很长一段时间,因为C语言在某些应用中以压倒性优势领先,且无可匹敌。他列举了C语言是如何渗透到千家万户,影响着世界运行的。对此,笔者对原文进行了编译,与大家共享!
现今存在的很多C语言项目都是几十年前开始的:
开发于1969年的UNIX操作系统,其代码在1972年基于C语言进行了重建,帮UNIX系统代码从汇编转移到更高层次的语言,进而实现用更少的代码完成相同的任务;
开发于1977年的Oracle,其代码也在1983年转向了C语言,Oracle是当下最受欢迎的数据库之一;
发布于1985年的Window 1.0操作系统,尽管源码并未公开,但据说大部分内核代码也是基于C语言构建,还有一部分是汇编;
开发于1991年的Linux,其内核也是基于C语言。Linux在1992年基于GNU重新获得许可,被作为GNU操作系统的一部分使用。GNU系统本身也是使用C和Lisp编程语言构建,所以它的许多组件都是基于C开发。
不少人可能会提出,这些系统都是几十年前的项目,当时的编程语言还不多,可供选择的就更少了。其实不然,C语言不仅仅局限于几十年前的项目,当下不少项目也是基于它启动的。
C语言如何驱动世界
编程语言层出不穷,各种高级语言更是如雨后春笋般涌现。但C语言仍然在为全世界的应用系统赋能,下面分享一些被数百万人广泛使用的C语言构建系统。
各大流行系统所用到的语言
Windows操作系统
据NetMarketShare统计,Windows操作系统份额常年在90%附近徘徊,服务全球数十亿用户,其内核代码大部分是由C语言构建,还有一部分是基于汇编。
Linux
众所周知,Linux内核主要是由C语言撰写,在世界500台最强大的超级计算机中,约有97%运行的是Linux内核,它也被用于许多个人电脑中。
macOS
Mac电脑操作系统也是由C语言驱动,因为OS X的内核大部分是用C语言编写。Mac中的每个程序和驱动程序,就像Windows和Linux电脑一样,都是在由C语言驱动的内核上运行。
移动设备
iOS、Android和Windows Phone的内核也是用C语言编写,它们只是对现有的Mac OS、Linux和Windows内核的移动改编。因此,大家每天使用的智能手机也是运行在C语言之上。
数据库领域
世界上最流行的数据库,包括Oracle、MySQL、MS SQL Server和PostgreSQL,都是用C语言构建(其中前三个实际上是C和C++)。
数据库被用于所有类型的系统:金融、政府、媒体、娱乐、电信、健康、教育、零售、社交网络、网络等等。
3D电影
此类应用程序需要高效、快速。它们需要在数秒内进行许多计算和处理大量数据,这样艺术家和动画师生成的电影镜头所需的时间才越短,公司也能节省更多资金。这类大部分应用也都是基于C和C++制作而成。
嵌入式系统
想象一下,某一天你醒来后的行程:唤醒你的闹钟很可能是用C语言编写,然后你用微波炉或咖啡机来做早餐,它们也是嵌入式系统,因此有可能也是基于C语言构建;你在吃早餐时打开电视或收音机,当你用遥控器打开车库门时,也在使用一个很可能是用C语言编程的嵌入式系统。
然后你准备开车外出。如果它有以下功能,也是用C语言编程的。
自动变速器
轮胎压力检测系统
传感器(氧气、温度、油位等)。
座椅和后视镜设置的记忆。
仪表盘显示
防抱死制动系统
自动稳定控制
巡航控制
气候控制
儿童安全锁
无钥匙进入
座椅加热
安全气囊控制
到商店,停好车,去自动售货机买汽水。那么自动售货机有可能也是基于C构建运行。随后你在商店里买东西,结账,那么收银机也是用C。当你用信用卡付款时?你猜对了:信用卡阅读器也可能是用C语言写的。
所有的这些设备都是嵌入式系统。它们就像小型计算机,里面有一个微控制器/微处理器,在嵌入式设备上运行一个程序,也叫固件。程序必须检测按键并采取相应的行动,同时向用户显示信息。例如,闹钟必须与用户互动,检测用户正在按什么按钮,有时还检测按了多长时间,并对设备进行相应编程,同时向用户显示相关信息。例如,汽车的防抱死制动系统必须能够检测到轮胎的突然锁定,并采取行动,在一小段时间内释放刹车上的压力,解除锁定,从而防止失控打滑。所有这些计算都是由一个编程的嵌入式系统完成的。
尽管不同品牌的嵌入式系统所使用的编程语言可能不同,但由于C语言的灵活性、效率、性能和接近硬件的特点,C语言是开发这些项目的首选。
C语言为什么仍被广泛使用?
在今天,有许多编程语言可以让开发者研发出比C更高效的应用,这些语言拥有丰富的内置库,可以简化与JSON、XML、UI、网页、客户端请求、数据库链接、媒体操作等工作。尽管如此,C依然仍将长期活跃在编程一线,为什么呢?
那让我们一起来看看C语言都有哪些无与伦比的优势。
可移植性和高效
汇编语言的可移植性差,可C语言却是一门可移植性非常好的语言。它尽可能地接近机器,同时它几乎普遍适用于现有的处理器架构。几乎现有的每个架构至少有一个C语言编译器。如今,由于现代编译器产生高度优化的二进制文件,用手写的汇编来改进它们的输出并不是一件容易的事。
由于它的可移植性和效率高效,"其他编程语言的编译器、库和解释器经常用C语言实现"。像Python、Ruby和PHP这些解释性语言的主要实现都是基于C语言,它甚至被其他语言的编译器用来与机器通信。例如,C是Eiffel和Forth的中间语言。意味着这些语言的编译器不需要为每个要支持的架构生成机器代码,而只是生成中间的C代码,由C编译器处理机器代码的生成。
C语言也已成为开发人员之间交流的一种语言。正如Dropbox工程经理、Cprogramming.com创建者Alex Allain所说:
C语言作为一门伟大的语言,可以让大多数人以能接受的方式来表达编程中的常见想法。此外,C语言在使用中也有语法结构也会出现在其他语言中,例如,用于命令行参数的argc和argv,以及循环结构和变量类型,因此,即使对方不懂C语言,你也能找到一些共同点来与他们交谈。
内存操作
内存管理和指针运算是C语言的重要特征,使C语言成为系统级编程(操作系统与嵌入式系统)的最佳搭档。
在硬件/软件边界,计算机系统和微控制器将其外设和I/O引脚映射到内存地址。系统应用程序必须读取和写入这些自定义的内存位置,以便与外界进行通信。因此,C语言操作任意内存地址的能力对于系统编程是必不可少的。
例如,一个微控制器可以这样设计:每当地址0x40008001的第4位被设置为1时,内存地址0x40008000中的字节就会被通用异步接收/发送器(或UART,一种与外设通信的常见硬件组件)发送,并且在设置后,它将被外设自动取消。下来演示一个C函数代码,它通过该UART发送一个字节:
#define UART_BYTE *(char *)0x40008000
#define UART_SEND *(volatile char *)0x40008001 |= 0x08
void send_uart(char byte)
{
UART_BYTE = byte; // write byte to 0x40008000 address
UART_SEND; // set bit number 4 of address 0x40008001
}
send_uart函数的第一行代码可扩展为:
*(char *)0x40008000 = byte;
这一行代码是告诉编译器将值是0x40008000解释为一个指向char的指针,然后解除对该指针的定义(给出该指针所指向的值)(用最左边的*操作符),最后将字节值分配给该解除定义的指针。换句话说:把变量byte的值写到内存地址0x40008000。
将该函数的下一行代码扩展一下:
*(volatile char *)0x40008001 |= 0x08;
在这行代码中,我们对地址0x40008001和数值0x08(二进制的00001000,即第4位的1)进行了or位运算操作,并将结果存回地址0x40008001。换句话说:我们设置地址为0x40008001的字节的第4位。我们还声明地址为0x40008001的值是易失性的。这就告诉编译器,该值可能会被我们代码外部的进程所修改,所以编译器在写入该地址后不会对该地址的值做出任何假设。(在这种情况下,该字节在我们用软件设置后就被UART硬件取消了)。这些信息对于编译器的优化器来说是很重要的。例如,如果我们在for循环中这样做,而没有指定该值是易失性的,编译器可能会认为该值在被设置后永远不会改变,并在第一个循环后跳过执行该命令。
确定资源使用
开发人员进行系统编程不能依赖的一个常见语言特性就是垃圾收集,甚至对一些嵌入式系统来说,只能进行动态分配。嵌入式应用程序在时间和内存资源方面非常有限。对于一些实时的嵌入系统,它们无法承受垃圾收集器的非确定性调用。如果因为内存不足而不能使用动态分配,那么拥有其他内存管理机制就显得尤为重要,比如将数据放在自定义地址中,就像C语言的指针所允许的那样。那些严重依赖动态分配和垃圾回收的语言不适用于资源紧张的系统。
Code Size
C语言有一个非常小的运行时,其代码的内存占用要小于其它语言。例如与C++相比,一个由C语言生成的二进制文件,其体积大约是由类似的C++代码生成的二进制文件的一半。造成这种情况的主要原因之一是异常支持。
异常(Exceptions )机制是C++比C语言多出来的一个不错功能,如果异常不被触发和巧妙的实现,他们实际上是没有执行时间的开销,但代价便是增加代码体积。
下面让我们以C++代码为例:
// Class A declaration. Methods defined somewhere else;
class A
{
public:
A(); // Constructor
~A(); // Destructor (called when the object goes out of scope or is deleted)
void myMethod(); // Just a method
};
// Class B declaration. Methods defined somewhere else;
class B
{
public:
B(); // Constructor
~B(); // Destructor
void myMethod(); // Just a method
};
// Class C declaration. Methods defined somewhere else;
class C
{
public:
C(); // Constructor
~C(); // Destructor
void myMethod(); // Just a method
};
void myFunction()
{
A a; // Constructor a.A() called. (Checkpoint 1)
{
B b; // Constructor b.B() called. (Checkpoint 2)
b.myMethod(); // (Checkpoint 3)
} // b.~B() destructor called. (Checkpoint 4)
{
C c; // Constructor c.C() called. (Checkpoint 5)
c.myMethod(); // (Checkpoint 6)
} // c.~C() destructor called. (Checkpoint 7)
a.myMethod(); // (Checkpoint 8)
} // a.~A() destructor called. (Checkpoint 9)
该段代码中的A类、B类和C类中的方法都被定义在了外部(例如在其它文件中)。因此,编译器无法对它们进行解析,也不知道是否会抛出异常。所以程序必须准备处理从它们的任何构造函数、析构函数或其他方法调用中抛出的异常。解构器不应该抛出(做法非常糟糕),但用户还是可以抛出,或者他们可以通过调用一些抛出异常的函数或方法(显式或隐式)间接地抛出。
如果myFunction中的任何调用抛出了异常,堆栈解开机制必须能够调用所有已经构建的对象的析构器。堆栈解开机制的一个实现将使用这个函数的最后一次调用的返回地址来验证触发异常的调用的 "检查点编号"(这是简单的解释)。它是通过利用一个辅助的自动生成的函数(一种查找表)来实现的,当该函数的主体抛出异常时,该函数将被用于堆栈解绕,这将与此类似。
如果myFunction函数的任何一个调用抛出异常,C++的栈展开(stack unwinding)机制必须能够调用所有已构建对象的析构器。栈展开机制的一个实现是将使用这个函数的最后一次调用的返回地址来验证触发异常调用的 "检查点编号"(这是简单的解释)。它是通过利用一个辅助的自动生成函数(一种查找表)来实现,在该函数的主体抛出异常时,该函数将被用于堆栈解绕,与下面这段代码类似:
// Possible autogenerated function
void autogeneratedStackUnwindingFor_myFunction(int checkpoint)
{
switch (checkpoint)
{
// case 1 and 9: do nothing;
case 3: b.~B(); goto destroyA; // jumps to location of destroyA label
case 6: c.~C(); // also goes to destroyA as that is the next line
destroyA: // label
case 2: case 4: case 5: case 7: case 8: a.~A();
}
}
如果从case 1和9抛出异常,则没有对象需要销毁。对于case 3,则b和a必须被销毁。对于case 6,c和a必须被销毁。在所有情况下,销毁顺序必须得到尊重。对于检查点2、4、5、7和8,只有对象a需要被销毁。
这个辅助函数增加了代码的体积。这是C++添加到C语言中的空间开销的一部分。许多嵌入式应用无法负担这种额外的空间。因此,用于嵌入式系统的C++编译器通常有一个禁用异常的标志。在C++中禁用异常是不自由的,因为标准模板库严重依赖异常来告知错误。使用这种修改过的方案,没有异常,需要对C++开发人员进行更多的培训,以检测可能的问题或发现错误。
C++的一个原则就是“开发者无需为不使用的东西付费”。对于其他语言来说,二进制体积的增加会变得非常糟糕,通过其它功能来增加额外开销,虽然这些功能有用,但嵌入式系统却负担不起。虽然C语言不会给你提供这些额外功能,但他可以比其它语言拥有更紧凑的代码足迹(code footprint ),占用更小的磁盘空间。
为什么要学习C语言
C语言并不难学,作为一门老牌编程语言,有关它的教程跟学习资料非常多,那么学习C语言有哪些好处呢?
通用语言
C语言是开发人员的通用语言,网上或者图书里面的不少算法都是基于C语言实现,这也为实现提供了最大的可移植性,开发者也会从中受益。
Understand the Machine(用C语言思考)
当我们与同事讨论代码的某些部分或其他语言的某些特征时,我们最终会 "用C语言说话":"这部分是向对象传递一个 "指针 "还是复制整个对象?这里会不会发生任何 "转换"?等等。
在分析高级语言的一部分代码的行为时,我们很少讨论(或思考)一部分代码正在执行的汇编指令。相反,在讨论机器在做什么时,我们可以用C语言描述(或想)得很清楚。
在许多有趣的C语言项目上工作
从大型数据库服务器或操作系统内核甚至是为了满足个人乐趣而制作的小型家用嵌入式应用,你都可以用C语言实现,并且还可以在网上找到相关Demo。Daniel呼吁大家,不要停止自己喜欢做的事情,比如学习C语言,它古老但小巧,并且是一门经过时间验证的编程语言。
总结
当下许多编程语言在其预设的用途上都要优于C语言,但这并不意味着就能击败C,当考虑性能优先的时候,C依然是王者。世界正运行在C语言驱动的设备上,无论你是否意识到,你使用的诸多设备的的确确都用到了C语言。
原文链接:https://www.toptal.com/c/after-all-these-years-the-world-is-still-powered-by-c-programming
END
一键三连 「分享」「点赞」「在看」
成就一亿技术人